clear
set more off
set matsize 5000

global lecind    "\\intra\partages\au_amic2\SRCV\TABLES_INITIALES_FEV2021\INPUT\INDIVIDUS"
global lecindsas "\\intra\partages\au_amic2\SRCV_AVRIL2021\TABLES_INITIALES_AVRIL2021\INDIVIDUS"
global lecindcsv "\\intra\partages\au_amic2\SRCV_AVRIL2021\TABLES_INITIALES_AVRIL2021\INDIVIDUS"
global ecrind    "\\intra\partages\au_amic2\SRCV_AVRIL2021\BASES_FEV2022_V5\2020\INDIVIDUS\autres_var"
global lectabpas "\\intra\partages\au_amic2\SRCV_AVRIL2021\TABLES_INITIALES_AVRIL2021\SRCV_2020"
global ecrstat   "\\intra\partages\au_amic2\SRCV_AVRIL2021\STAT_fev2022_V5\2020_new"

/* 1 - EXTRACTION DES VARIABLES SELECTIONNéES */
/* fichier CSV 3 ème livraison 2020 */

foreach an of numlist 20 {
cd "$lecindcsv"
use individus_20`an'.dta, clear
keep RB030 RB040 age  ///
typemploi classif DATDEB* DATFIN* ///
mrec oceup PL015 PL020 ///
PL073 PL074 PL075 PL076 PL080 PL085 PL087 ///
SITUAD* ///
PL211A PL211B PL211C PL211D PL211E PL211F PL211G PL211H PL211I PL211J PL211K PL211L ///
nbemplois mofacta PL160
gen annee_SRCV = 20`an'
order RB030 RB040 annee_SRCV 
cd "$ecrind"
save autres_indiv_act_`an'.dta, replace
display `an'
count 
}

/* 2 - CHANGEMENT DE NOM DES VARIABLES */
foreach an of numlist 20 {
cd "$ecrind"
use autres_indiv_act_`an'.dta, clear
rename DATDEB_01 datdeb
rename DATDEB_02 datdeb2
rename DATDEB_03 datdeb3
rename DATDEB_04 datdeb4
rename DATDEB_05 datdeb5
rename DATDEB_06 datdeb6
rename DATDEB_07 datdeb7
rename DATDEB_08 datdeb8
rename DATDEB_09 datdeb9
rename DATDEB_10 datdeb10
rename DATDEB_11 datdeb11
rename DATDEB_12 datdeb12
rename DATDEB_13 datdeb13
rename DATDEB_14 datdeb14
rename DATDEB_15 datdeb15

rename DATFIN_01 datfin
rename DATFIN_02 datfin2
rename DATFIN_03 datfin3
rename DATFIN_04 datfin4
rename DATFIN_05 datfin5
rename DATFIN_06 datfin6
rename DATFIN_07 datfin7
rename DATFIN_08 datfin8
rename DATFIN_09 datfin9
rename DATFIN_15 datfin15

rename PL015 pl015
rename PL020 pl020
rename PL087 pl087
rename PL073 pl073
rename PL074 pl074
rename PL075 pl075
rename PL076 pl076
rename PL080 pl080
rename PL085 pl085
rename PL160 pl160

rename PL211A pl211a
rename PL211B pl211b
rename PL211C pl211c
rename PL211D pl211d
rename PL211E pl211e
rename PL211F pl211f
rename PL211G pl211g
rename PL211H pl211h
rename PL211I pl211i
rename PL211J pl211j
rename PL211K pl211k
rename PL211L pl211l

rename SITUAD_01 situad
rename SITUAD_02 situad2
rename SITUAD_03 situad3
rename SITUAD_04 situad4
rename SITUAD_05 situad5
rename SITUAD_06 situad6
rename SITUAD_07 situad7
rename SITUAD_08 situad8
rename SITUAD_09 situad9
save "$ecrind\autres_indiv_act_`an'.dta", replace
}

/* 3 - MISE EN FORME DES VARIABLES */

* 3-1 REMPLACENEMENT DES NA PAR BLANC 

foreach var of varlist mofacta pl020 pl015 pl073 pl074 pl075 pl076 pl080 pl085 pl087 pl211a pl211b pl211c pl211d pl211e pl211f pl211g pl211h pl211i pl211j pl211k pl211l pl160 {
cd "$ecrind"
use autres_indiv_act_20.dta, clear
tab `var', missing
replace `var' = "" if `var' == "NA"
tab `var', missing
save "$ecrind\autres_indiv_act_20.dta", replace
}

* 3-2 DESTRING DES VARIABLES CARACTERE 
foreach var of varlist nbemplois mofacta mrec pl020 classif oceup typemploi situad situad2 situad3 situad4 situad5 situad6 situad7 situad8 situad9 pl015 pl073 pl074 pl075 pl076 pl080 pl085 pl087 pl211a pl211b pl211c pl211d pl211e pl211f pl211g pl211h pl211i pl211j pl211k pl211l pl160  {
cd "$ecrind"
use autres_indiv_act_20.dta, clear
tab `var', missing
destring `var', replace
tab `var', missing
save "$ecrind\autres_indiv_act_20.dta", replace
}

/* 4 - CREATION DE LA VARIABLE YEAR ET ORDRE DES VARIABLES */
clear
use "$ecrind\autres_indiv_act_20.dta", clear
gen year = annee_SRCV - 1
order RB040 RB030 annee_SRCV year age classif ///
datdeb datfin situad datdeb2 datfin2 situad2 datdeb3 datfin3 situad3 datdeb4 datfin4 situad4 datdeb5 datfin5 situad5 datdeb6 datfin6 situad6 datdeb7 datfin7 situad7 datdeb8 datfin8 situad8 ///
datdeb9 datfin9 situad9 datdeb10 datdeb11 datdeb12 datdeb13 datdeb14 datdeb15 datfin15 /// 
mrec oceup pl015 pl020  ///
pl073 pl074 pl075 pl076 pl080 pl085 pl087 ///
pl211a pl211b pl211c pl211d pl211e pl211f pl211g pl211h pl211i pl211j pl211k pl211l ///
nbemplois mofacta pl160
save "$ecrind\autres_indiv_act_2020_def.dta", replace

/* 5 - CREATION DES VARIABLES PL211A_NEW à PL211L_NEW 
       combinant les modalités de pl210 et pl211 
	   afin d'obtenir des séries sur toute la période de 2008 à 2020
	   réduction du nombre de modalités à 8 (la modalité 9 restera absente par mesure d'harmonisation avec le passé : le service national a été aboli en 2001)
	   Etudiant 6 recodé en 7 , retraité 7 recodé en 6, tâche domest. 9 recodé en 8, autres 10 recodé en 8 , 9 reste non alimenté
	   */
clear
use "$ecrind\autres_indiv_act_2020_def.dta", clear
gen pl211a_new = pl211a
replace pl211a_new = 6  if pl211a == 7
replace pl211a_new = 7  if pl211a == 6
replace pl211a_new = 8  if pl211a == 10 
replace pl211a_new = 8  if pl211a == 9

gen pl211b_new = pl211b
replace pl211b_new = 6  if pl211b == 7
replace pl211b_new = 7  if pl211b == 6
replace pl211b_new = 8  if pl211b == 10 
replace pl211b_new = 8  if pl211b == 9 

gen pl211c_new = pl211c
replace pl211c_new = 6  if pl211c == 7
replace pl211c_new = 7  if pl211c == 6
replace pl211c_new = 8  if pl211c == 10 
replace pl211c_new = 8  if pl211c == 9 

gen pl211d_new = pl211d
replace pl211d_new = 6  if pl211d == 7
replace pl211d_new = 7  if pl211d == 6
replace pl211d_new = 8  if pl211d == 10 
replace pl211d_new = 8  if pl211d == 9 

gen pl211e_new = pl211e
replace pl211e_new = 6  if pl211e == 7
replace pl211e_new = 7  if pl211e == 6
replace pl211e_new = 8  if pl211e == 10 
replace pl211e_new = 8  if pl211e == 9

gen pl211f_new = pl211f
replace pl211f_new = 6  if pl211f == 7
replace pl211f_new = 7  if pl211f == 6
replace pl211f_new = 8  if pl211f == 10 
replace pl211f_new = 8  if pl211f == 9

gen pl211g_new = pl211g
replace pl211g_new = 6  if pl211g == 7
replace pl211g_new = 7  if pl211g == 6
replace pl211g_new = 8  if pl211g == 10 
replace pl211g_new = 8  if pl211g == 9 

gen pl211h_new = pl211h
replace pl211h_new = 6  if pl211h == 7
replace pl211h_new = 7  if pl211h == 6
replace pl211h_new = 8  if pl211h == 10 
replace pl211h_new = 8  if pl211h == 9 

gen pl211i_new = pl211i
replace pl211i_new = 6  if pl211i == 7
replace pl211i_new = 7  if pl211i == 6
replace pl211i_new = 8  if pl211i == 10 
replace pl211i_new = 8  if pl211i == 9 

gen pl211j_new = pl211j
replace pl211j_new = 6  if pl211j == 7
replace pl211j_new = 7  if pl211j == 6
replace pl211j_new = 8  if pl211j == 10 
replace pl211j_new = 8  if pl211j == 9 

gen pl211k_new = pl211k
replace pl211k_new = 6  if pl211k == 7
replace pl211k_new = 7  if pl211k == 6
replace pl211k_new = 8  if pl211k == 10 
replace pl211k_new = 8  if pl211k == 9 

gen pl211l_new = pl211l
replace pl211l_new = 6  if pl211l == 7
replace pl211l_new = 7  if pl211l == 6
replace pl211l_new = 8  if pl211l == 10 
replace pl211l_new = 8  if pl211l == 9 

label variable pl211a_new	"Activité principale en janvier N-1"
label variable pl211b_new	"Activité principale en février N-1"
label variable pl211c_new	"Activité principale en mars N-1"
label variable pl211d_new	"Activité principale en avril N-1"
label variable pl211e_new	"Activité principale en mai N-1"
label variable pl211f_new	"Activité principale en juin N-1"
label variable pl211g_new	"Activité principale en juillet N-1"
label variable pl211h_new	"Activité principale en août N-1"
label variable pl211i_new	"Activité principale en septembre N-1"
label variable pl211j_new	"Activité principale en octobre N-1"
label variable pl211k_new	"Activité principale en novembre N-1"
label variable pl211l_new	"Activité principale en décembre N-1"

save "$ecrind\autres_indiv_act_2020_def.dta", replace

/* 5 - CREATION DE LA VARAIBLE CONTRAT EN 2020 A PARTIR DE TYPEMPLOI  */
/* TYPEMPLOI n'a que 6 modalités alors que 7 annoncées dans la doc et en historique */      

clear
use "$ecrind\autres_indiv_act_2020_def.dta", clear
gen contrat = typemploi
tab typemploi, missing
tab contrat, missing
label variable contrat	"Type de contrat remplace par TYPEMPLOI en 2020"
save "$ecrind\autres_indiv_act_2020_def.dta", replace

/* controle nb obs */
clear
use "$ecrind\autres_indiv_act_2020_def.dta", clear
clear
use "$ecrind\autres_indiv_act_2020_def.dta", clear
duplicates drop  RB040 , force
clear
use "$ecrind\autres_indiv_act_2020_def.dta", clear
duplicates drop  RB030 , force

/* 6 - CREATION DES VARIABLES NBEMP_NEW MOFACTA_NEW */
clear
use "$ecrind\autres_indiv_act_2020_def.dta", clear
rename RB030 rb030
gen nbemp_new = nbemplois
rename mofacta mofacta_new
tab nbemp_new, missing
tab nbemplois, missing
tab mofacta_new, missing
save "$ecrind\autres_indiv_act_2020_def.dta", replace


/* 7 - vérification cohérence temporelle des variables modalités */
/* 7-1 variables existant sur toute la période */

clear
use "$ecrind\autres_indiv_act_2020_def.dta", clear
cd "$ecrstat"
foreach var of varlist `var' nbemp_new nbemplois mofacta_new pl160 {
tab `var'  if annee_SRCV==2020, matcell(freq) matrow(names)
putexcel set "$ecrstat\verif_var_individu_act_2020", sheet("`var'") modify
putexcel AN2=("2020") 		AO2=("Freq.") 	 AP2=("Percent")
putexcel AN3=matrix(names)  AO3=matrix(freq) AP3=matrix(100*(freq/r(N)))
}
